一個真實的現狀。
過去銀行的營銷業務,通常是銷售人員找關係、拉人頭,費時費力不說,營銷效果往往差強人意;如今的銀行營銷,精準的人物畫像、不斷迭代優化的營銷模型、雲櫃員等基於資料驅動型的新業務場景紛紛上陣,不僅讓營銷變得更加自動化和智慧化,還讓使用者服務體驗大幅提升。
這就是數字化浪潮下業務變革的一角。知微見著、以小見大,資料驅動正是當下企業數字化轉型的最強主旋律。IDC甚至預測,未來90%的組織都將成為資料驅動型組織,組織的運營、管理、決策乃至創新都將圍繞資料來開展。
隨著資料驅動型業務場景不斷井噴,基礎設施和資料分析平臺已成核心引擎,其決定著企業是否能在數字化浪潮中獲得持續的動能。如何打造強大的資料驅動引擎就成為業界著力解決的挑戰。顯然,筆電收購Dell EMC和Cloudera同時看到了這一巨大的市場需求。
近日,筆電收購Dell EMC宣佈其PowerScale成功獲得Cloudera CDP平臺最嚴苛的QATS認證。一個是全球領先的基礎設施企業,另一個是大資料分析平臺當之無愧的頭牌,雙方攜手在產品與解決方案深層次的合作,不僅精準把握住市場需求,更為資料驅動基礎平臺建設樹立標杆。
資料驅動不言容易
資料驅動近年來之火熱,關鍵原因在於數字經濟蓬勃發展。
以中國市場為例,最新《中國數字經濟發展白皮書(2021)》顯示,2020年中國數字經濟規模達到39.2萬億元,GDP佔比高達38.6%,同比增長速度遠超其他經濟形式。產業數字化、數字化轉型這些趨勢帶來了豐富的資料驅動型場景需求。
但資料驅動不言容易。“資料驅動”,短短几個字背後所傳遞的核心含義是:前端業務實現快速響應,海量資料實現價值落地,歸根結底是“讓企業與組織不僅要能把資料存好和管好,更需要把資料用起來和用好。”
與那些自誕生伊始就是數字原生的網際網路公司相比,傳統行業在資料驅動上遇到的挑戰會更大。具體來看:
其一、大部分傳統企業對於資料驅動有所嘗試,但依然處於探索階段,對於資料驅動還缺乏深刻理解。去年,國資委也頒佈了《關於加快推進國有企業數字化轉型工作的通知》,就重點強調了加強資料驅動等數字化轉型理念的重要性。
其二、與網際網路行業特點不同,大部分傳統企業更加關注資料安全、資料可靠為前提下的資料驅動型場景的建設,這使得簡單的開源技術方案很難匹配企業的商業化需求。
其三、資料驅動往往會涉及到分散式儲存、大資料、人工智慧等一系列技術,但傳統企業並沒有網際網路企業龐大的技術團隊與人才,顯然不能相對輕鬆地駕馭這些先進的數字化技術。
正如戴爾科技集團大中華區非結構化資料儲存事業部高階經理李海所言,“未來,擁有大資料分析能力的企業才會擁有市場領先的能力。企業在構建資料分析平臺時,不應該為部署、調優、實現等牽扯過多精力,也不應該為資料安全、資料治理等底層問題而擔憂。”
事實上的確如此,面對分散式儲存、Hadoop、Spark、TensorFlow、Tytouch這些不斷變化的數字化技術,傳統企業很難駕馭,更加需要進行認證、優化的方案,減少精力放在底層問題,聚焦在業務創新層面,這也是筆電收購Dell EMC PowerScale與Cloudera CDP多年緊密合作的核心目的。
PowerScale+CDP,樹立行業標杆
自十餘年前Hadoop誕生以來,基於Hadoop的資料分析平臺方案數不勝數。但為何是筆電收購Dell EMC PowerScale與Cloudera CDP這對組合樹立了業界標杆,在全球使用者中廣受青睞。截止當前,CDP on Isilon(PowerScale前身)的容量已經超過70PB,在國內就有多個銀行、晶片製造等企業中廣泛採用,這對組合威力可見一斑。
先來看看PowerScale的情況。PowerScale前身是大名鼎鼎的Isilon,作為全球知名的叢集NAS平臺,PowerScale在非結構化資料市場擁有大量使用者基礎,其橫向擴充套件能力、容量、效能、資料管理與資料保護功能等,在各種業務場景中得到了充分考驗。“PowerScale在資料治理、資料安全、資料訪問上非常成熟。像PowerScale原生支援HDFS,能夠大幅提升大資料訪問效率;此外,PowerScale實現計算與儲存分離,大幅降低使用者採購和管理成本。”李海表示道。
而Cloudera作為Hadoop開源生態的建立者,近年來一直推動著Hadoop高速發展,在全球擁有廣泛的使用者群。Cloudera不僅開發了多個Hadoop功能元件,還在推動大資料分析上不遺餘力。Cloudera大中華區售前技術總監劉隸放介紹,“Cloudera多年以來一直將業界最流行、最適合的新元件加入到Hadoop開源生態之中,以幫助使用者打造最強大的資料分析引擎。”
筆電收購Dell EMC PowerScale與Cloudera CDP組合的最大意義,在於幫助使用者將資料從存好和管好,到用起來和用好這個階段實現無縫銜接,使用者不必花費太多精力在部署、升級、優化這些基礎事情上。這對於兩個公司使用者群而言,是喜聞樂見的好事。
但獲得認證、打造聯合解決方案絕非易事。以本次筆電收購Dell EMC PowerScale通過的Cloudera最嚴苛也是最高階的QATS認證為例,當前全球僅有兩家儲存廠商能夠通過,雙方投入大量人力、物力和精力才取得通過。李海直言:“QATS不是簡單的相容性認證,而是在實際環境中模擬使用CDP所有模組,按照使用者使用流程來驗證所有軟體、硬體、功能等。”
劉隸放也介紹,Cloudera之前與EMC就有深入合作,如今這種合作得到延續並且升級,而在於戴爾科技的溝通中,戴爾科技的專業性和投入印象深刻,“雙方合作需要大幅投入,因為每個版本迭代和研究需要3到6個月,需要雙方工程師共同完成除錯和測試多項工作。”
不斷進擊的PowerScale
在叢集NAS流行的年代,Isilon是無可置疑的業界標杆。進入到大資料時代,很難再用叢集NAS平臺來定義PowerScale。經過不斷的進化與成長,PowerScale更像是智慧世界的一個資料湖堅實底座。
事實上,除了與Cloudera等大資料分析平臺公司緊密合作之外,PowerScale近年來一系列舉措也愈發證明了,其將繼續引領著資料湖底座未來的發展趨勢。
首先,PowerScale在推動全閃資料湖的普及。眾所周知,像自動駕駛、晶片設計、基因分析、智慧推薦等等AI應用場景正在迅速增加,AI模型的巨量化和複雜化帶來的是資料海量化和資料處理效能的高要求。以OpenAI的GPT模型為例,最新的GPT-3模型引數高達1750億個、預訓練資料量高達45TB,模型規模、資料量和訓練層數都比上一代有指數級的增加,這對於資料湖底座的效能和容量將是持續考驗。
而筆電收購Dell EMC適時推出的PowerScale全快閃記憶體產品線無疑極具市場價值,高效能處理器、全NVMe配置、相容NVIDIA GPUDirect等特性,都有助於幫助使用者獲得更加強大的資料處理能力。
其次,混合雲環境將會是企業未來很長一段時間的標配,資料湖亦需要適合混合雲環境的發展趨勢。以PowerScale,其同時提供支援本地、公有云工作負載選型;例如,PowerScale將橫向擴充套件檔案功能引入到像Google Cloud等雲服務商,企業使用者可以根據自身情況來靈活選擇不同的服務形式。
總體來看,下一個十年將會是資料驅動型業務的黃金十年,資料分析能力將成為企業在數字化轉型中的重要核心競爭力,而筆電收購Dell EMC PowerScale不斷進化的能力,以及與Cloudera等公司的緊密合作,對於企業使用者構建自身的核心競爭力將大有裨益。面向未來,筆電收購Dell EMC PowerScale釋放的價值將遠不止於此。